Leyes de conservación para arquitecturas neuronales modernas Descubre el marco unificado que revela invariantes en gradiente descendente para arquitecturas modernas (GELU, SiLU, SwiGLU, MoE). Validado experimentalmente. 2026-06-17 · 2 min